iT邦幫忙

2024 iThome 鐵人賽

DAY 26
0
AI/ ML & Data

資料科學的小筆記系列 第 25

Day26:使用dplyr的集合運算函數

  • 分享至 

  • xImage
  •  

今天要來紀錄dplyr的集合運算函數

建立範例資料集

library(dplyr)

# 建立表格 x 和 y
x <- tribble(
  ~A,  ~B, ~C,
  "a", "t",  1,
  "b", "u",  2,
  "c", "v",  3
)

y <- tribble(
  ~A,  ~B, ~C,
  "b", "u",  2,
  "c", "v",  4,
  "d", "w",  5
)
  1. intersect(): 找出兩個資料表中共有的列
    說明: intersect() 函數會回傳兩個資料表中都出現的列。
# 找出兩個表格共有的列
result_intersect <- intersect(x, y)

print(result_intersect)

https://ithelp.ithome.com.tw/upload/images/20240906/20168607je4YmipDO9.png

  1. setdiff(): 找出只存在於一個資料集中的列
    說明: setdiff() 函數會回傳只在 x 資料表中出現、但不在 y 資料表中出現的列。
# 找出只存在於 x 的列
result_setdiff <- setdiff(x, y)

print(result_setdiff)

https://ithelp.ithome.com.tw/upload/images/20240906/20168607sCebVMV9W6.png

今天的小筆記先到這邊~

參考資料:

  1. Data transformation with dplyr :: Cheatsheet

上一篇
Day25:使用dplyr進行資料表連接(由欄位配對判斷)
下一篇
Day27:使用dplyr的集合運算函數
系列文
資料科學的小筆記29
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言